home *** CD-ROM | disk | FTP | other *** search
/ Amiga Format CD 32 / Amiga Format AFCD32 (Nov 1998, Issue 117).iso / -in_the_mag- / under_the_bonnet / bustest / bustest.readme < prev    next >
Text File  |  1998-08-20  |  9KB  |  171 lines

  1. Short: update to memory speed tester (OS2.0 required)
  2. Type: util/moni
  3. Uploader: mlelstv@serpens.swb.de
  4. Author: mlelstv@serpens.swb.de
  5.  
  6. bustest is a small utility to measure data transfer speed
  7. to and from memory. It requires AmigaOS2.0 or higher.
  8.  
  9. Method:
  10.  
  11.   determine a chunk of memory and time read and write operations with the
  12.   pretty exact CIA timers. After that the overhead of the measurement is
  13.   compensated.
  14.  
  15.   During measurement other tasks are locked out, but _interrupts_ are not.
  16.   However, interrupt activity shouldn't influence the measurement unless
  17.   you send lots of data to the serial port or sit on a heavy duty network.
  18.  
  19. What you get ?
  20.  
  21.   The performance of a very large sequence of MOVE instructions.
  22.   Either word or long word moves or bursts of 8 longword moves
  23.   using the MOVEM instruction are used.
  24.  
  25. Caveats:
  26.  
  27.   The 68040 and 68060 usually uses a _copyback_ cache. This means,
  28.   that _writing_ causes the cache to _read_ the data first (and
  29.   later _write_ it) thus halving write performance when writing
  30.   large blocks.
  31.  
  32.   Small blocks like local variables usually fit into the cache and
  33.   are just read once which is the reason for the good performance
  34.   of the copyback cache. But.. block writes are the worst case. The
  35.   68040 has a special MOVE16 instruction to circumvent that problem,
  36.   but it is not used in the AmigaOS (nor in this test program).
  37.  
  38.   The 68040 and 68060 have rather large caches and especially the
  39.   68060 uses an effective pseudo-random cache replacement strategy
  40.   which bias results if the tested memory area isn't much larger
  41.   than the cache. This is the reason why previous versions of bustest
  42.   yielded too high transfer rates for cached memory. The 16k area
  43.   still generated more than 50% cache hits in case of the 68060.
  44.  
  45. How to use:
  46.  
  47.   bustest ADDR/K,SIZE/K,CHIP/S,FAST/S,ROM/S,MEGA/S
  48.  
  49.   ADDR/K   hexadecimal start address of a memory region to test.
  50.            This address can specify memory that does not appear in
  51.            the system memory list (like a graphics frame buffer)
  52.            or memory in the free list. bustest tries to check the
  53.            address and will refuse to test it when it believes that
  54.            the memory is used by anything else. BUT: it is possible
  55.            to specify addresses that are not mapped to anything,
  56.            resulting in thousands of bus errors. So be careful when
  57.            using that option.
  58.   SIZE/K   size of the test region in bytes. You can use the suffix
  59.            'k' to specify units of 2^10 bytes and 'm' to specify
  60.            units of 2^20 bytes. The size is rounded up to a multiple
  61.            of 128 which is the granularity of the test loop. The
  62.            default is 256 kilobytes.
  63.   CHIP/S   test an AllocMem'd region in chip memory.
  64.   FAST/S   test an AllocMem'd region in fast memory.
  65.   ROM/S    test the region starting at address $00F80000, i.e the
  66.            kickstart ROM (or the RAM that is mapped there with the
  67.            MMU if you use something like CPU FASTROM).
  68.   MEGA/S   show data rates in units of 2^20Byte/s instead of the
  69.            normal 10^6Byte/s.
  70.  
  71. Examples:
  72.  
  73.   this test was done on an A3000 with a CyberStorm Mk2 accelerator board.
  74.   the ROM is actually a copy of the Kickstart in RAM remapped with the
  75.   rom2fast program.
  76.  
  77.   1> bustest fast chip rom
  78.   BusSpeedTest 0.19 (mlelstv)   Buffer:     262144 Bytes, Alignment: 32768
  79.   ========================================================================
  80.   memtype   addr       op         cycle     calib         bandwidth
  81.   fast      $086F8000  readw      71.5 ns   normal      28.0 * 10^6 byte/s
  82.   fast      $086F8000  readl     121.7 ns   normal      32.9 * 10^6 byte/s
  83.   fast      $086F8000  readm     121.4 ns   normal      33.0 * 10^6 byte/s
  84.   fast      $086F8000  writew     86.9 ns   normal      23.0 * 10^6 byte/s
  85.   fast      $086F8000  writel    174.7 ns   normal      22.9 * 10^6 byte/s
  86.   fast      $086F8000  writem    174.3 ns   normal      22.9 * 10^6 byte/s
  87.   chip      $000B0000  readw    1052.4 ns   normal       1.9 * 10^6 byte/s
  88.   chip      $000B0000  readl    1051.8 ns   normal       3.8 * 10^6 byte/s
  89.   chip      $000B0000  readm    1052.2 ns   normal       3.8 * 10^6 byte/s
  90.   chip      $000B0000  writew    568.4 ns   normal       3.5 * 10^6 byte/s
  91.   chip      $000B0000  writel    569.0 ns   normal       7.0 * 10^6 byte/s
  92.   chip      $000B0000  writem    569.0 ns   normal       7.0 * 10^6 byte/s
  93.   rom       $00F80000  readw      71.5 ns   normal      28.0 * 10^6 byte/s
  94.   rom       $00F80000  readl     122.6 ns   normal      32.6 * 10^6 byte/s
  95.   rom       $00F80000  readm     121.9 ns   normal      32.8 * 10^6 byte/s
  96.  
  97.   If you reduce the test area you see the speed of the cache. The
  98.   68060 can access the cache at every clock for a maximum speed of
  99.   50MHz * 4Byte = 200MByte/s.
  100.  
  101.   1> bustest fast size=2k
  102.   BusSpeedTest 0.19 (mlelstv)   Buffer:       2048 Bytes, Alignment: 32768
  103.   ========================================================================
  104.   memtype   addr       op         cycle     calib         bandwidth
  105.   fast      $08640000  readw      20.2 ns   normal      98.9 * 10^6 byte/s
  106.   fast      $08640000  readl      20.1 ns   normal     198.7 * 10^6 byte/s
  107.   fast      $08640000  readm      20.1 ns   normal     199.0 * 10^6 byte/s
  108.   fast      $08640000  writew     20.0 ns   normal     100.1 * 10^6 byte/s
  109.   fast      $08640000  writel     20.1 ns   normal     198.7 * 10^6 byte/s
  110.   fast      $08640000  writem     20.1 ns   normal     198.7 * 10^6 byte/s
  111.  
  112.   If you increase the size you see partial cache trashing caused by
  113.   interrupts that reduce the effective bandwidth. Also, in this case
  114.   bustest cannot effectively compensate overhead but shows a less
  115.   precise estimate (calib == "biased")
  116.   
  117.   1> bustest fast size=8k
  118.   BusSpeedTest 0.19 (mlelstv)   Buffer:       8192 Bytes, Alignment: 32768
  119.   ========================================================================
  120.   memtype   addr       op         cycle     calib         bandwidth
  121.   fast      $08640000  readw      20.7 ns   biased      96.6 * 10^6 byte/s
  122.   fast      $08640000  readl      21.3 ns   biased     188.2 * 10^6 byte/s
  123.   fast      $08640000  readm      21.7 ns   biased     184.6 * 10^6 byte/s
  124.   fast      $08640000  writew     20.9 ns   biased      95.6 * 10^6 byte/s
  125.   fast      $08640000  writel     21.3 ns   biased     187.4 * 10^6 byte/s
  126.   fast      $08640000  writem     21.9 ns   biased     182.3 * 10^6 byte/s
  127.  
  128.   If you increase the size further the cache becomes less effective.
  129.   Here is the result that compares to the old bustest (version 0.07):
  130.  
  131.   1> bustest fast size=16k
  132.   BusSpeedTest 0.19 (mlelstv)   Buffer:      16384 Bytes, Alignment: 32768
  133.   ========================================================================
  134.   memtype   addr       op         cycle     calib         bandwidth
  135.   fast      $08640000  readw      54.2 ns   biased      36.9 * 10^6 byte/s
  136.   fast      $08640000  readl      87.2 ns   biased      45.9 * 10^6 byte/s
  137.   fast      $08640000  readm      88.5 ns   biased      45.2 * 10^6 byte/s
  138.   fast      $08640000  writew     64.8 ns   biased      30.9 * 10^6 byte/s
  139.   fast      $08640000  writel    122.8 ns   biased      32.6 * 10^6 byte/s
  140.   fast      $08640000  writem    124.9 ns   biased      32.0 * 10^6 byte/s
  141.  
  142.   Here is the result for a test of the motherboard memory (specifying
  143.   FAST did AllocMem() the test area and the SIMMs on the CyberStorm
  144.   have a higher priority).
  145.   
  146.   1> bustest addr=07010000
  147.   BusSpeedTest 0.19 (mlelstv)   Buffer:     262144 Bytes, Alignment: 32768
  148.   ========================================================================
  149.   memtype   addr       op         cycle     calib         bandwidth
  150.   user      $07010000  readw     159.3 ns   normal      12.6 * 10^6 byte/s
  151.   user      $07010000  readl     299.0 ns   normal      13.4 * 10^6 byte/s
  152.   user      $07010000  readm     298.8 ns   normal      13.4 * 10^6 byte/s
  153.   user      $07010000  writew    254.5 ns   normal       7.9 * 10^6 byte/s
  154.   user      $07010000  writel    511.8 ns   normal       7.8 * 10^6 byte/s
  155.   user      $07010000  writem    507.5 ns   normal       7.9 * 10^6 byte/s
  156.  
  157.   This test couldn't start at $07000000 because the first few bytes
  158.   are used up by the memory header. If you try you just get an error
  159.   message:
  160.  
  161.   1> bustest addr=07000000
  162.   Address $07000000 is mapped. Test aborted.
  163.  
  164. Problems:
  165.  
  166.   Blitter activity can produce pretty bogus results.
  167.   The test takes more time than the one in bustest 0.07 because of
  168.   the larger test area
  169.  
  170. Michael van Elst
  171.